top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Stability AI、テキストから画像への変換モデル「DeepFloyd IF」を発表

Stability AIは、最新製品「DeepFloyd IF」を発表し、AIとテクノロジーの世界でブレークスルーを起こしました。DeepFloyd IFは、テキストを画像に高いフォトリアリズムと精度で統合できる、強力なテキスト・トゥ・イメージ・カスケード・ピクセル拡散モデルです。

この最先端モデルは、非商用で研究が許されるライセンスでリリースされ、研究室が高度なテキストから画像への生成アプローチを実験できるようになっています。Stability AIは、将来的に完全にオープンソースのDeepFloyd IFモデルをリリースする意向も表明しています。


DeepFloyd IFの最も印象的な特徴の1つは、テキストプロンプトを理解し、画像に適用する能力です。これは、大規模な言語モデルT5-XXL-1.1をテキストエンコーダとして使用し、さらに大量のテキスト-画像クロスアテンションレイヤーを使用することで実現されています。その結果、さまざまな空間関係に現れるさまざまな性質のオブジェクトと一緒に、首尾一貫した明確なテキストを生成するモデルが誕生しました。

また、DeepFloyd IFは、標準的な正方形だけでなく、垂直や水平といった非標準的なアスペクト比の画像を生成する機能を備えています。この機能は、正方形のアスペクト比の画像生成に限定される他のテキスト画像生成モデルとは一線を画しています。

また、「ゼロショット画像間変換」は、微調整を必要としない画像加工を可能にする画期的な機能です。これは、元画像を64ピクセルにリサイズし、順方向拡散でノイズを加え、新しいプロンプトで逆方向拡散を使い、画像をノイズ除去するというプロセスです。また、プロンプトのテキスト記述による超解像モジュールによってスタイルをさらに変更することができ、ユーザーはソース画像の基本形を維持しながら、出力におけるスタイル、パターン、詳細を変更する機会を得ることができます。


DeepFloyd IFモデルをトレーニングするために、Stability AIは、10億の(画像、テキスト)ペアを含むカスタム高品質LAION-Aデータセットを利用しました。LAION-Aは、LAION-5Bデータセットの英語部分の美的サブセットであり、類似ハッシュに基づく重複排除、余分なクリーニング、および元のデータセットへのその他の変更を経て得られたものです。電子透かし、NSFW、その他の不適切なコンテンツを除去するために、同社のカスタムフィルターが使用された。

テキストから画像への変換モデルの性能は、Fréchet Inception Distance(FID)スコアで評価され、スコアが低いほど性能が優れていることを示します。DeepFloyd IFは、COCOデータセットにおいて、ゼロショットで6.66という素晴らしいFIDスコアを達成し、その高いフォトリアリズムと精度を反映しています。

最後に、DeepFloyd IFのリリースは、テキスト画像生成の分野における大きなブレークスルーとなります。テキストを理解し、高い精度で画像を生成するこのモデルは、広告からインテリアまで、幅広い業界に革命を起こす可能性を秘めています。研究者や開発者は、この強力な新ツールを使って、どんな革新的なアプリケーションを作り出せるか、ぜひ試してみたいものです。

この記事を共有:

最新のニュース
TP Tech、TP.ai FAB AIオーケストレーションプラットフォームを発表

TP Tech、TP.ai FAB AIオーケストレーションプラットフォームを発表

25/12/12 0:00

インドネシアのTPは、ジャカルタで開催された重要なイベントにおいて、最新のイノベーションであるTP.ai FABを発表しました。

Fortience AI新規ビジネス評価サービス

Fortience AI新規ビジネス評価サービス

25/12/12 0:00

フォーティエンス(東京都千代田区)は、AIと専門コンサルタントの知見を組み合わせた「AIエージェントによる新規事業企画評価サービス」を12月10日から開始する。

NTTデータ北海道とNTT-AT札幌市役所事務効率化実験

NTTデータ北海道とNTT-AT札幌市役所事務効率化実験

25/12/12 0:00

NTTデータ北海道(北海道札幌市)とNTT-AT(東京都新宿区)は、札幌市の行政内部事務の効率化を目指し、共同で実証実験を行うことを発表した。

Google DeepMind、英国とのAI安全性研究協力を拡大

Google DeepMind、英国とのAI安全性研究協力を拡大

25/12/12 0:00

英国AIセキュリティ研究所(AISI)との連携拡大は、より安全な人工知能開発の実現に向けた重要な一歩となります。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
TP Tech、TP.ai FAB AIオーケストレーションプラットフォームを発表

TP Tech、TP.ai FAB AIオーケストレーションプラットフォームを発表

25/12/12 0:00

インドネシアのTPは、ジャカルタで開催された重要なイベントにおいて、最新のイノベーションであるTP.ai FABを発表しました。

Fortience AI新規ビジネス評価サービス

Fortience AI新規ビジネス評価サービス

25/12/12 0:00

フォーティエンス(東京都千代田区)は、AIと専門コンサルタントの知見を組み合わせた「AIエージェントによる新規事業企画評価サービス」を12月10日から開始する。

NTTデータ北海道とNTT-AT札幌市役所事務効率化実験

NTTデータ北海道とNTT-AT札幌市役所事務効率化実験

25/12/12 0:00

NTTデータ北海道(北海道札幌市)とNTT-AT(東京都新宿区)は、札幌市の行政内部事務の効率化を目指し、共同で実証実験を行うことを発表した。

Google DeepMind、英国とのAI安全性研究協力を拡大

Google DeepMind、英国とのAI安全性研究協力を拡大

25/12/12 0:00

英国AIセキュリティ研究所(AISI)との連携拡大は、より安全な人工知能開発の実現に向けた重要な一歩となります。

bottom of page